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基于 OpenMP 的 高 效 多 子 阵 合 成 孔径 声 纳 距 离 多 普 勒 成 像 算 法 
钟 何平 ， 黄 ” 攀 ， 唐 劲松 


(海军 工程 大 学 海军 水 声 技术 研究 所 , 武汉 430033) 


摘 要 : 为 充分 利用 多 核 CPU 计算 资源 解决 多 子 阵 合成 孔径 声 纳 成 像 效 率 低 的 问题 , 提出 了 一 种 共享 内 存 环 境 下 的 距 
离 多 普 勒 成 像 算 法 并 行 解决 方案 。 在 分析 多 子 阵 合成 孔径 声 纳 距离 多 普 勒 成 像 算法 并 行 性 的 基础 上 ,对 算法 中 预 处 理 、 
距离 向 脉冲 压缩 、 固 定 相位 补偿 、 距 离 徙 动 校 正和 方位 向 脉冲 压缩 进行 了 OpenMP 并 行 化 设计 ， 充 分 利用 多 核 CPU 计 
算 资 源 实现 了 大 数据 量 合成 孔径 声 纳 图 像 快速 重 构 。 对 实测 数据 的 成 像 实 验 结果 表明 ,并 行 成 像 算 法 加 速 比 高 达 19.86， 
满足 实时 合成 孔径 声 纳 系统 成 像 需 求 。 
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Efficient range doppler imaging algorithm for multi-array 
synthetic aperture sonar based on OpenMP 


Zhong Heping, Huang Pan, Tang Jinsong 
(Naval Institute of Underwater Acoustic Technology, Naval University of Engineering, Wuhan 430033, China) 


Abstract: An efficient range Doppler imaging algorithm for multi-array synthetic aperture sonar (SAS) in shared memory 


environment based on OpenMP is proposed, which solves the imaging problem of low efficiency by multi-core CPU resources. 
Considered the parallel characteristic of range Doppler algorithm for multi-array SAS, The signal processing process have been 


parallelized such as preprocessing, range compression, phase compensation, range cell migration compensation and azimuth 


compression based on OpenMP, which greatly enhances the reconstruction process of SAS image by multi-core CPU resources. 
The imaging test performed on real data shows that the speedup of the parallel imaging algorithm is up to 19.86 times, which 
meets the demand for real-time processing of SAS imaging. 
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群 方式 计算 存在 计算 设备 体积 大 、 功 耗 大 ， 不 能 满足 水 声 设备 
的 小 体积 、 低 功 耗 ， 运 输 方 便 的 要 求 。 

多 子 阵 合成 孔径 声 纳 (Synthetic aperture sonar，SAS) 是 一 种 近年 来 ， 随 着 多 核 技 术 不 断 成 熟 ， 共 享 内 存 架构 [9 已 成 为 
高 分 辩 率 成 像 声 纳 03, 其 显著 特点 是 方位 向 分 辨 率 与 距离 无 关 ， ”各 类 型 计算 节点 的 标准 配置 ,并 且 共 享 内 存 并 行程 序 拓展 性 好 ， 
并 且 高 于 常规 侧 扫 声 纳 1~2 个 数量 级 ， 在 水 下 小 目标 探测 应 用 ”其 性 能 与 单 核 计算 速度 和 核 数 成 正比 ， 可 在 不 同 平台 上 可 直接 
方面 具有 重要 用 途 (* 1。 多 子 阵 SAS 得 以 应 用 的 一 个 重要 前 提 ” 运行。 本 文 在 此 基础 上 提出 了 一 种 共享 内 存 环 境 下 的 多 子 阵 
就 是 实现 合成 孔径 声 纳 图 像 的 快速 重建 .91, 而 距离 多 普 勒 成 像 。” SAS 距离 多 普 勒 快速 成 像 算 法 ， 有 效 提升 了 合成 孔径 声 纳 成 像 
算法 (range Doppler algorithm，RDA) 是 一 种 经 典 的 合成 孔径 成 效率 ， 满 足 实 时 合成 孔径 声 纳 成 像 需 求 。 

像 算法 ， 兼 具 模 块 化 处 理 能 力 和 一 维 操作 简便 性 ， 至 今 仍 被 广 2 

泛 应 用 于 多 种 合成 孔径 成 像 场景 中。 随 着 合成 孔径 声 纳 系统 成 全 全 条 
像 分 辨 率 的 不 断 提高 和 测绘 带宽 度 的 不 断 加 大 ， 用 于 成 像 的 原 1.1 OpenMP 并 行 模 型 

始 数 据 量 不 断 加 大 ,严重 影响 了 合成 孔径 声 纳 系统 的 成 像 效 率 。 由 于 多 核 技 术 的 发 展 ， 多 核 CPU 进行 并 行 计算 来 提高 
SAS 实时 成 像 在 硬件 上 可 采用 专用 信号 处 理 机 091, 但 存在 研发 。 计算 效率 已 被 广泛 采用 ,多 核 CPU 的 多 个 线程 在 物理 上 是 并 行 
周期 长 、 价 格 高 和 不 易 拓 展 等 缺点 。 为 了 提升 计算 性 能 ， 自 的 ， 其 编程 属于 共享 存储 的 编程 模型 。OpenMP 是 共享 存储 器 
系统 &40 也 用 在 了 SAS 成 像 ， 获 得 了 实时 处 理 结 果 ， 但 采用 集 ”模型 的 并 行 编程 标准 ， 它 是 为 共享 存储 环境 编写 并 行程 序 设 计 
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的 一 个 应 用 程序 接口 ,目前 支持 Fortran 和 C/C++, 其 标准 中 包 
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括 一 套 编译 指导 语句 及 一 个 文 持 函 数 库 。OpenMP 在 并 行 执行 
程序 时 , 采用 的 是 “Fork/Join” 方 式 , 其 并 行 执行 过 程 如 图 1 所 
示 。 程 序 开始 时 只 有 一 个 主线 程 ， 程 序 中 的 串 行 区 域 都 
程 执 行 ， 并 行 部 分 通过 派生 其 他 线程 来 共同 完成 。 从 图 1 中 可 
以 看 出 ，OpenMP 程序 并 行 结束 之 前 是 不 能 执行 串 行 部 分 的 ， 
这 就 是 标准 的 Fork/Join 并 行 模式 。 


主线 程 
本 派生 线程 


Re 1. 
[| Join 
行 区 域 派生 线程 


| 1 


图 1 Fork/Join 执行 模型 


1.2 ”并行 计算 效率 

加 速 比 是 衡量 并 行 算法 性 能 的 一 个 重要 指标 ， 它 定量 描述 
了 一 个 程序 实现 并 行 化 后 , 由 于 执行 时 间 的 减少 而 获得 的 性 能 。 
在 处 理 器 资源 独 享 的 前 提 下 ， 假 设 某 个 应 用 程序 的 执行 时 间 为 
了 7, ， 而 该 程序 并 行 化 后 , 在 P 个 处 理 器 上 并 行 执行 所 需 的 时 间 
为 了, ， 则 该 并 行程 序 在 该 计算 机 上 的 加 速 比 5S, 定义 为 : 
5S, =T/T, ,理论 上 , 5, 的 值 越 大 , 并 行 系统 获得 的 效率 越 高 。 
加 速 比 通常 小 于 CPU 的 总 核 数 。 因 此 , 加 速 比 一 般 要 求 向 CPU 
核 数 靠近 。 
行 算 法 的 效率 高 并 不 等 于 处 理 器 的 利用 率 很 高 ， 为 此 引 
入 算法 效率 的 概念 效率 书 , 度量 了 每 个 处 理 器 有 效 使 用 部 分 占 
总 的 执行 时 间 比 ， 通 常 定义 位 ，E, =S,/P。 

行 算法 的 效率 理想 值 为 1, 但 一 般 情况 下 都 小 于 1, 主要 


是 因为 程序 的 并 行 化 程度 不 高 ， 而 且 存 在 通信 以 及 同步 等 时 间 
开销 所 致 。 
1.3 测试 平台 

为 测试 并 行 成 像 算法 性 能 ， 本 文选 用 了 一 台 笔记 本 和 一 个 


刀片 计算 节点 ， 有 具体 配置 如 下 : 

笔记 本 : 处 理 器 Intel® CoreGM i5-4200H CPU@2.80 GB 
4 核 显卡 NVIDIA GeForce GTX 950 MB， 内 存 4GB， 操 作 系 
统 Windows7 旗舰 版 64 位 ， 软 件 环 境 开 发 环境 : Visual Studio 
2008。 

刀片 计算 节点 : 人 处理 器 Intel Xeon CPU E5-2690 
V2@3.0 GB 2 处 理 器 40 核 ， 内 存 32 GB， 操 作 系 统 Windows 
Server 2008 64 位 ， 软 件 环境 开发 环境 : Visual Studio 2008 。 


2 ”算法 描述 


2.1 多 子 阵 SAS 距离 多 普 勒 成 像 算法 
距离 多 普 勒 成 像 算法 利用 距离 相同 而 方位 不 同 的 散射 点 在 


距离 多 普 勒 域 具有 相同 的 能 量 轨迹 ， 通 过 插值 解 二 维 耦 合 ， 将 
成 像 的 二 维 处 理 转换 成 两 个 一 维 处 理 级 联 的 形式 ， 实 现 距离 向 
处 理 与 方位 向 处 理 的 分 离 。 多 子 阵 SAS 常用 成 像 方法 就 是 将 多 
主线 “ 子 阵 回 波 信号 转换 为 单子 回 波 信号 形式 ， 然 后 调用 单 阵 距离 多 


普 勒 成 像 算法 实现 图 像 重 构 。 图 2 给 出 了 多 子 阵 SAS 距离 多 普 
勒 成 像 算 法 的 基本 流程 。 图 中 FFT 和 IFFT 分 别 表示 傅 里 叶 变 
换 和 传 里 叶 逆 变换 。 
从 信号 处 理 流程 上 看 , 多 子 阵 SAS 距离 多 普 勒 成 像 主要 包 


括 预 处 理 、 距 离 向 脉冲 压缩 、 固 定 相 位 补偿 和 方位 向 脉冲 压缩 
四 个 步 又。 在 进行 方位 向 脉冲 压缩 ， 回 波 信号 变换 到 距离 多 普 
勒 域 ， 距 离 向 和 方位 向 信号 不 能 解 簿 和 时 ， 需 要 利用 耗 时 的 插 
值 操 作 来 完成 距离 向 和 方位 向 解 耘 。 
多 子 阵 SAS 原 始 
数据 
预 处 理 


距 人 征 动 壤 王 广 
绩 二 
> 中 冲 
让 多 2 压 


数 


固定 相位 补偿 


图 2 距离 多 普 勒 算法 流程 


2.2 算法 并 行 性 能 分 析 
2.2.1 预 处 理 

SAS 原始 数据 是 按照 采集 脉冲 顺序 依次 进行 存储 ， 脉 冲 内 
部 按照 通道 编号 顺序 进行 存储 ， 对 于 一 幅 SAS 原始 回 波 数据 ， 
其 距离 向 点 数 为 NR ， 方 位 向 点 数 为 NAO = NPluse* NC ， 划 
中 NPluse 和 NC 分 别 表 示 脉 冲 个 数 和 接收 阵 个 数 。 预 处 理 主 
要 是 对 采集 的 原始 数据 进行 数据 类 型 转换 和 进行 有 效 子 阵 数据 
截取 ， 其 中 数据 类 型 转换 是 将 采样 点 由 short 类 型 转换 为 float 
类 型 ， 其 并 行 度 为 NAO。NR 。 有 效 子 阵 截取 是 根据 脉冲 重复 
间隔 PRI 、 载 体 速 度 V 和 子 阵 长 度 刀 之 间 的 关系 
PRIeV = DeM /2 来 确定 用 于 成 像 的 有 效 子 阵 个 数 M ， 然 
后 对 原始 数据 每 个 脉冲 截取 前 M 个 子 阵 数据 组 成 新 的 数据 块 ， 
截取 后 的 数据 块 大 小 为 NA。 NR ， 其 中 NA = NPluseeM 。 
于 截取 过 程 是 以 单个 脉冲 数据 为 对 象 进行 的 数据 搬移 操作 ， 所 
以 并 行 度 为 NPluse 。 
2.2.2 距离 向 脉冲 压缩 

预 处 理 后 的 数据 进行 距离 向 脉冲 压缩 时 ， 主 要 包含 距离 向 
FFT、 与 距离 向 参考 函数 相 乘 和 距离 向 IFFT 三 个 处 理 步 又。 由 
于 预 处 理 后 的 数据 是 按照 脉冲 顺序 进行 存储 的 ， 在 进行 距离 向 
FFT 变换 时 ， 不 同方 位 向 上 距离 线 数据 之 间 是 相互 独立 的 《〈 即 
图 像 中 两 行 数据 是 相互 独立 的 )， 可 同时 进行 FFT 变换 ， 其 
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行 度 为 NA 。 距 离 向 参考 函数 为 
H(f.)=exp(jz f?/p) (1) 


其 中 : f 表示 距离 向 基带 频率 ，K 为 信号 调频 斜率 , 它 与 每 一 
距离 线 上 数据 相 乘 时 是 相互 独立 的 ， 而 不 同 距 离线 上 数据 相 乘 
也 是 相互 独立 的 ， 因 此 该 处 理 步骤 并 行 度 为 NAe NR 。 与 FFT 
变换 相似 ， 距 离 向 IFFT 变换 的 并 行 度 也 为 NA 。 

2.2.3 固定 相位 补偿 
固定 相位 补偿 是 将 距离 向 脉冲 压缩 后 的 多 子 阵 回 波 变 为 单 
子 阵 回 波形 式 , 以 便利 用 单 阵 SAS 距离 多 普 勒 成 像 算 法 进行 处 
理 。 固 定 相位 补偿 精度 直接 关系 到 最 终 成 像 结 果 的 分 辨 率 ， 不 
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似 , 方位 向 IFFT 变换 的 
的 并 行 度 如 表 1 所 示 。 


行 度 也 为 NR 。 成 像 算 法 各 处 理 步 骤 


表 1 成 像 算法 各 处 理 步 又 并 行 度 
处 理 步骤 名 称 子 步 又 名 称 并 行 处 理 粒度 “并行 度 
数据 类 型 转换 数据 点 NAe NR 
预 处 理 
有 效 子 阵 截 取 永 冲 块 NPluse 
距离 向 FFT 和 IFFT 距离 线 数据 NA 
距离 向 脉冲 压缩 。 | 
距离 向 参考 函数 相 乘 数据 点 N4eNR 
司 定 相 位 补偿 固定 相位 补偿 数据 点 N4eNR 
方位 向 FFT 和 IFFT ”方位 线 数据 NR 
方位 向 脉冲 压缩 。 ”距离 向 徙 动 校正 数据 点 NAe® NR 
方位 向 参考 函数 相 乘 数据 点 N4eNR 


同学 者 针对 具体 成 像 条 件 下 的 相位 补偿 方法 进行 了 深入 研究 
03。 引 入 停 走 停 近似 修正 后 的 偏 置 相位 中 心 近似 ， 且 停 走 停 的 
修正 只 考虑 距离 空 变 情形 下 的 固定 相位 补偿 公式 为 


Mam onl j 2 (和 健 ]| 0) 
re C 2 
其 中 : 为 中 心 频 率 ，Ah 为 第 i 个 接收 子 阵 与 发 射 阵 方位 向 
等 效 相位 中 心间 隔 ; C 为 声速 ; v 为 载体 速度 ; 7 为 斜 距 。 从 相 
位 补偿 因子 可 看 出 其 为 Ah, 和 7 两 个 变量 的 函数 ， 每 一 点 的 补 
类 过 程 是 相互 独立 的 ， 因 此 该 处 理 步骤 并 行 度 为 NAe NR 。 
2.2.4 方位 向 脉冲 压缩 
方位 向 脉冲 压缩 主要 包括 方位 向 FFT、 距 离 向 徙 动 校正 、 
与 方位 向 参考 函数 相 乘 和 方位 向 IFFT。 由 于 声 纳 数 据 是 按照 距 
离 向 排列 的 ， 在 进行 方位 向 处 理 前 需要 进行 矩阵 转 置 操 作 ， 方 


位 向 处 理 完 成 后 再 进行 一 次 矩阵 转 置 操作 变 回 为 先前 排列 方式 。 


间 是 相 


在 进行 方位 向 FFT 变换 时 , 不 同 距 离 向 上 方位 线 数据 之 
互 独立 的 ， 可 同时 进行 FFT 变换 ， 其 并 行 度 为 NR 。 

距离 向 徙 动 校正 是 在 距离 多 普 勒 域 采 用 插值 实现 最 近 距 离 
线 的 统一 校正 ， 其 效率 与 插值 核 


相同 而 方位 不 同 点 目标 能 量 
有 关 ， 通 常 8 点 插值 核 已 经 能 够 满足 要 求 。 原 始 数 据 变 换 至 距 
离 多 普 勒 域 后 ， 需 插值 校正 的 时 间 偏 移 量 是 一 个 与 f。 和 7 相关 


的 二 维 空 变 函数 : 


pe Wak . G) 
C 1-of? /487) 
其 中 : C 为 声速 ，v 为 载体 速度 ，7 为 斜 距 ; 态 为 中 心 频率 ; 
/为 方位 向 频率 。 距离 多 普 勒 域 中 每 一 点 的 校正 过 程 是 相互 独 
立 的 ， 因 此 该 步骤 的 并 行 度 为 NA。 NR 。 
在 距离 多 普 勒 域 中 ， 方 位 向 参考 函数 为 


H(A eR | (4) 


可 见方 位 向 参考 函数 也 为 一 个 与 f。 和 7 相关 的 二 维 空 变 
函数 ， 它 与 距离 多 普 勒 域 中 每 一 点 数据 相 乘 是 相互 独立 的 
此 该 处 理 步 又 并 行 度 为 NAe NR 。 

方位 向 脉冲 压缩 的 最 后 一 步 为 TFT 变换 。 与 FFT 变换 类 


图 


2.3 ”共享 内 存 环 境 下 并 行 算法 设计 
2.3.1 预 处 理 
预 处 理 主要 包括 数据 类 型 转换 和 有 效 子 阵 截取 。 为 避免 地 
址 计算 , 前 者 采用 一 重 for 循环 实现 , 后 者 采用 两 重 for 循环 实 
现 , 其 中 后 者 外 层 for 针对 脉冲 数 进行 循环 ,两 者 都 通过 parallel 
for 指令 进行 并 行 化 有效 子 阵 截 取 步 又 针对 外 层 脉 冲 数 循环 进 
行 并 行 ， 伪 代码 如 下 所 示 。 

Preprocessing(A,B, NumOfPluse, Nc) 
型 原始 数据 
B:complex<float> 类 型 数据 


A:complex<short> 类 


NumOfPluse: 脉 冲 个 数 

Nc :有 效 子 阵 个 数 

parallel for i=1 to length[A] 

B[i] < A[i] / 32768.6 

parallel for i=1 to NumOfPluse 

for j=1 to Nc 

提取 B 中 第 i 个 脉冲 第 j 个 子 阵 数 据 构成 新 数据 块 , 舍 去 

2.3.2 距离 向 脉冲 压缩 

在 进行 距离 压缩 前 ， 首 先 需 要 计算 出 距离 向 参考 函数 。 为 
与 FFT 变换 结果 直接 相 乘 , 在 计算 参考 函数 时 ，_, 的 取 值 


多 余子 阵 数 据 。 


范围 设 定 为 [0,7F,] 来 避免 频谱 搬移 带 来 的 额外 运算 量 ， 其 中 


1F, 表示 距离 向 采样 频率 。 距 离 向 脉冲 压缩 通过 parallel for 指 
令 对 外 层 行 循 环 进行 并 行 化 ， 每 一 行 数 据 依 次 进行 FFT 变换 、 


与 距离 向 参考 函数 点 乘 和 IFFT 变换 ， 并 行 完 成 距离 向 脉冲 压 
缩 。 
2.3.3 固定 相位 补偿 

根据 固定 相位 补偿 公式 可 知 ， 不 同 脉冲 数据 的 补偿 因子 相 


同 ， 并 且 补 偿 过 程 也 相同 。 为 避免 相位 补偿 因子 重复 计算 ， 本 
文 先 开辟 单个 脉冲 数据 大 小 的 临时 空间 存储 相位 补偿 因子 ， 然 
后 计算 出 补偿 因子 数组 ， 最 后 与 声 纳 数 据 相 乘 完成 多 子 阵 回 波 
向 单 阵 回 波 的 转换 。 初 始 化 相位 补偿 因子 过 程 中 ， 将 距离 向 采 
样 点 数 循环 放 在 外 层 ， 子 阵 个 数 循环 放 在 内 层 。 在 与 声 纳 数据 
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对 应 相 乘 过 程 中 ， 将 脉冲 数 循环 放 在 外 层 ， 通 过 parallel for 指 


令 实 
2.3.4 


纲 并 行 固定 相位 补偿 。 
方位 向 脉冲 压缩 
于 固定 相位 补偿 后 数据 


进行 
距离 


向 频率 ) 的 校正 过 
parallel for 指 


靳 。 


一 步 


在 每 个 线程 内 部 


是 按照 先 距离 向 后 方位 向 排列 ， 


方位 向 FFT 变换 前 ， 


开辟 


首先 需要 进行 数据 重组 。 考 虑 到 不 同 
可 数据 FFT 变换 满足 独立 性 ,为 同日 
长 度 为 NA 的 临时 
离散 的 方位 向 数据 搬移 到 内 存 连 续 的 临时 
变换 后 再 将 数据 搬移 至 原来 位 置 ， 


时 进行 FFT 变换 ， 本文 
数据 空间 ， 将 原始 内 存 
数据 空间 ， 完 成 FFT 
同时 删除 临时 内 存 空间 。 


Chi 
钟 何平 ， 等 ， 娄 于 OpenMp 的 站 于 件 C21V 


位 补偿 、 方 位 


向 FFT、 距 离 徙 动 校正 和 方位 向 IFFT 各 处 理 


合作 期 


| 
Hs 


步骤 


加 速 比分 别 为 2.39、2.40、2.57、2.53、2.76 和 2.56。 在 计算 平 


台 B 上 ， 串 行 算法 成 像 时 间 为 19 244 ms， 
加 速 比 高 达 19.86， 计 算 效 率 为 0.50。 成 像 算法 


仅 为 969 ms， 


中 距离 向 脉冲 
正和 方位 向 IFFT 各 处 至 
23.47 和 27.83 。 从 两 组 实验 对 比 
速 比 高 ， 主 要 是 通过 增 


压缩 、 固 定 相位 补偿 、 


行 算法 成 像 时 间 


方位 向 FFT、 距 离 徙 动 校 
步骤 加 速 比 分 别 为 13.55、9.41、18.01、 
结果 可 看 出 ， 计 算 平 台 B 上 加 


加 计算 核 数 获 得 的 ， 


接 下 来 是 进行 距离 徙 动 校 


正 。 由 于 不 同行 (这 里 表示 方位 


程 是 独立 的 ， 本 文 对 外 


丑行 循环 直接 采用 


行 。 因 


令 进行 


最 后 一 步 是 与 方位 向 参考 函 
是 相互 独立 的 ， 但 是 不 同 距离 向 的 


不 同 距 离 向 的 处 


过 程 


插值 过 程 中 要 使 用 固定 偏 移 量 位 


置 相 令 数据， 线程 内 部 访问 数组 时 要 进行 严格 的 下 标 有 效 性 判 


数 相 乘 并 进行 FFT 变换 ， 这 


方位 向 参考 函数 不 同 。 为 使 不 同 距 离 向 数据 同时 与 方位 向 参考 


函数 
临时 
连续 


相 乘 


进行 IFFT 变换 , 在 每 个 线程 内 部 开辟 长 度 为 NA 的 


数据 存储 空 
的 临时 空 | 


s 间 ， 将 原始 内 
间 ， 然 后 计算 方 


存 离散 的 方位 向 数据 搬移 到 内 存 
位 向 参考 函数 并 与 对 应 方位 向 数 


据 相 乘 , 最 后 进行 IFFT 变换 后 再 将 数据 搬移 至 原来 位 置 , 完成 
向 脉冲 压缩 ， 实 现 最 终 SAS 图 像 重 构 。 


方位 


3 


行 计 
不 同 
取 当 
成 像 


法 > 


实验 结果 


为 验证 


享 内 存 环境 下 的 多 子 阵 SAS 距离 多 普 勒 成 像 算 
法 效率 ， 本文 在 1.3 节 所 示 两 种 


行 计 算 平 台 上 测试 了 CPU 串 


算 方 法 和 基于 OpenMP 共 


享 内 存 并 行 计算 方法 的 成 


平台 上 测试 时 ， 使 用 同 


程序 ， 程 序 启动 时 ， 首 先 自动 获 


前 计算 平台 上 核 数 ， 


将 


其 设置 为 计算 核 数 ， 然 后 再 进行 


处 理 。 
由 于 预 处 理 所 占 时 间 少 ， 
实验 所 用 数据 是 2010 年 


成 像 过 程 中 ， 距 离 徙 动 校正 采用 8 点 的 sinc 


插值 方 
在 效率 分 析 时 忽略 不 计 。 
7 月 在 某 内 陆 湖 进行 干涉 合成 孔 


径 声 


仿 所 


4 个 合成 孔径 长 度 共 


方位 


限 仅 
像 


结果 数 扩 


纳 海 试 样机 实验 中 获取 的 


， 具 体 实验 参数 如 表 2 所 示 。 实 


I 


用 数据 块 原始 


sf 
以 凸 宁 


度 如 图 3(a) 所 示 。 该 数据 块 包含 


计 72 个 
向 点 数 为 3 456， 获 取 时 


mm 


为 17.28 s。 


售 号 处 理 过 程 


环境 
程序 
两 者 


法 效 
时 间 


竞 下 进行 了 串 行 


串 行 运行 和 并 行 运 行 所 得 
相同 ， 验 证 了 并 行 成 像 程 
两 种 并 行 计算 平台 下 ， 
率 比 较 结果 如 表 3 所 示 。 
为 16 731 ms， 并 行 


居 方 位 向 点 数 变 为 2 880。 本 文 首先 在 两 种 并 行 
和 并 行 成 像 实验 ， 图 3(b) 和 (c) 分 别 是 成 像 


串 行 与 
在 计算 平 
算法 成 像 时 间 为 6 534 ms， 加 速 比 为 


脉冲 数据 ， 距 离 向 点 数 为 9 600， 
间 为 23.04 s。 由 于 相 邻 数据 块 之 
间 存 在 1 个 合成 孔径 长 度 的 数据 重 闭 


， 所 以 用 于 成 像 的 时 间 上 
了 效 子 阵 数据 个 数 为 40,， 成 
计算 


中 ， 


的 成 像 结 果 。 从 成 像 效果 图 来 看 ， 
序 功 能 的 正确 性 。 
行 SAS 距离 多 普 勒 成 像 算 
台 A 上 ， 串 行 算法 成 像 


2.56， 计 算 效率 为 0.64。 成 像 算法 中 距离 向 脉冲 压缩 、 固 定 相 


像 效率 。 


但 与 计算 平台 A 相 


比 , 并 行 效率 较 低 , 与 原始 数据 有 效 部 分 获取 时 间 17.28 s 相 比 ， 
满足 实时 合成 孔径 声 纳 系统 成 像 需要 。 
表 2 实验 系统 参数 
参数 数值 参数 数值 
载 频 (kHz) ”150 ”脉冲 重复 时 间 (ms) 320 
带宽 (kHz) ”20 子 阵 长 度 (m) 0.08 
脉 宽 ms) 20 子 阵 个 数 48 
声速 (m/s) “1448 载体 速度 (m/s) 3 


80 100 120 


140 1 
距离 向 ( 米 ) 
(9) 原 始 回 波 信号 


80 100 1 60 


4 ”结束 语 


本 文 在 分 析 多 子 阵 SAS 距离 多 普 勒 成 像 算法 
的 基础 上 ， 利 用 OpenMP 并 行 工 
种 快速 合成 孔径 声 


离 多 普 勒 成 像 算法 中 的 预 处 理 、 距 离 向 脉冲 压缩 、 


20 140 2 1 
距离 向 ( 米 ) 
(b) 串 行 成 像 结果 


80 100 120 


140 ”160 
距离 向 ( 米 ) 


(c) 并 行 成 像 结 
3 实测 数据 成 像 实验 


180 


对 


行 性 特点 


在 


< 享 内 存 环 境 下 提出 了 一 
纳 距 离 多 普 勒 成 像 算 法 ,针对 多 子 阵 SAS 距 


固定 相位 补 


偿 和 方位 向 脉冲 


压缩 关键 处 理 步骤 完成 了 


< 享 内 存 


环境 下 的 


行 化 设计 ， 


在 不 同 并行 计 算 平台 上 采 | 


实测 数据 进行 了 成 像 


性 能 和 效率 对 比 测试 。 实 验 结果 表明 ， 所 提 并 行 成 像 算 法 加 速 


录用 稿 


比 随 着 计算 平台 核 数 增加 而 变 大 ， 当 计算 核 数 较 多 时 ， 所 提 并 


行 成 像 算法 满足 实时 成 像 需求 。 


表 3 不 同 计算 方法 效率 比较 /ms 


计算 平台 成 像 方 法 ”距离 向 脉冲 压缩 ”固定 相位 补偿 ”方位 向 FFT 距离 徙 动 校正 ”方位 向 脉冲 压缩 ”总 时 间 ”效率 
串 行 3360 231 2840 6216 4084 16731 

A 并 行 1405 96 1105 2455 1482 6543 0.64 
加 速 比 2.39 2.40 2.57 2.53 2.76 2.56 
串 行 3564 480 3043 7370 4787 19244 

B 并 行 263 51 169 314 172 969 0.50 
加 速 比 13.55 9.41 18.01 23.47 27.83 19.86 


注 :计算 平台 A 表示 笔记 本 ,计算 平台 B 表示 刀片 计算 节点 。 
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